Análisis de convergencia débil de algoritmos actor-crítico neuronales en línea
<meta content=Analizamos la convergencia débil de algoritmos actor-crítico neuronales en línea. Estudio riguroso sobre aprendizaje por refuerzo profundo y optimización estocástica.>